智能论文笔记

SYN-MAD 2022: Competition on Face Morphing Attack Detection Based on Privacy-aware Synthetic Training Data

Marco Huber , Fadi Boutros , Anh Thi Luu , Kiran Raja , Raghavendra Ramachandra , Naser Damer , Pedro C. Neto , Tiago Gonçalves , Ana F. Sequeira , Jaime S. Cardoso

分类：计算机视觉

2022-08-15

本文介绍了基于2022年国际生物识别技术联合会议（IJCB 2022）举行的基于隐私感知合成训练数据（SYN-MAD）的面部变形攻击检测的摘要。该竞赛吸引了来自学术界和行业的12个参与团队，并在11个不同的国家 /地区举行。最后，参与团队提交了七个有效的意见书，并由组织者进行评估。竞争是为了介绍和吸引解决方案的解决方案，这些解决方案涉及检测面部变形攻击的同时，同时出于道德和法律原因保护人们的隐私。为了确保这一点，培训数据仅限于组织者提供的合成数据。提交的解决方案提出了创新，导致在许多实验环境中表现优于所考虑的基线。评估基准现在可在以下网址获得：https：//github.com/marcohuber/syn-mad-2022。

translated by 谷歌翻译

Face Morphing Attack Detection Using Privacy-Aware Training Data

Marija Ivanovska , Andrej Kronovšek , Peter Peer , Vitomir Štruc , Borut Batagelj

分类：计算机视觉

2022-07-02

变形面的图像对面对识别的安全系统构成了严重威胁，因为它们可用于非法验证具有单个变形图像的多人身份。现代检测算法学会使用真实个体的真实图像来识别这种变形攻击。这种方法提出了各种隐私问题，并限制了公开培训数据的数量。在本文中，我们探讨了仅在不存在的人及其各自的形态上接受训练的检测算法的功效。为此，对两种专用算法进行了合成数据的训练，然后在三个现实世界数据集上进行了评估，即：FRLL-MORPHS，FERET-MORPHS和FRGC-MORPHS。我们的结果表明，合成的面部图像可以成功用于检测算法的训练过程，并将其概括为现实世界情景。

translated by 谷歌翻译

Y-GAN: Learning Dual Data Representations for Efficient Anomaly Detection

Marija Ivanovska , Vitomir Štruc

分类：计算机视觉

2021-09-28

We propose a novel reconstruction-based model for anomaly detection, called Y-GAN. The model consists of a Y-shaped auto-encoder and represents images in two separate latent spaces. The first captures meaningful image semantics, key for representing (normal) training data, whereas the second encodes low-level residual image characteristics. To ensure the dual representations encode mutually exclusive information, a disentanglement procedure is designed around a latent (proxy) classifier. Additionally, a novel consistency loss is proposed to prevent information leakage between the latent spaces. The model is trained in a one-class learning setting using normal training data only. Due to the separation of semantically-relevant and residual information, Y-GAN is able to derive informative data representations that allow for efficient anomaly detection across a diverse set of anomaly detection tasks. The model is evaluated in comprehensive experiments with several recent anomaly detection models using four popular datasets, i.e., MNIST, FMNIST and CIFAR10, and PlantVillage.

translated by 谷歌翻译

Multi-modal deep learning system for depression and anxiety detection

Brian Diep , Marija Stanojevic , Jekaterina Novikova

分类：自然语言处理

2022-12-30

Traditional screening practices for anxiety and depression pose an impediment to monitoring and treating these conditions effectively. However, recent advances in NLP and speech modelling allow textual, acoustic, and hand-crafted language-based features to jointly form the basis of future mental health screening and condition detection. Speech is a rich and readily available source of insight into an individual's cognitive state and by leveraging different aspects of speech, we can develop new digital biomarkers for depression and anxiety. To this end, we propose a multi-modal system for the screening of depression and anxiety from self-administered speech tasks. The proposed model integrates deep-learned features from audio and text, as well as hand-crafted features that are informed by clinically-validated domain knowledge. We find that augmenting hand-crafted features with deep-learned features improves our overall classification F1 score comparing to a baseline of hand-crafted features alone from 0.58 to 0.63 for depression and from 0.54 to 0.57 for anxiety. The findings of our work suggest that speech-based biomarkers for depression and anxiety hold significant promise in the future of digital health.

translated by 谷歌翻译

Evaluation Framework for Computer Vision-Based Guidance of the Visually Impaired

Krešimir Romić , Irena Galić , Marija Habijan , Hrvoje Leventić

分类：计算机视觉

2022-09-20

视力障碍者的日常运动有重大问题。因此，我们以前的一些工作涉及计算机愿景来开发援助系统，以指导在关键情况下视力障碍。其中一些情况包括在室内和室外环境中的道路交叉路口和楼梯上的人行横道。本文为在此类关键情况下基于计算机视觉障碍的人提供了一个评估框架。提出的框架包括用于标记和存储指导方向的参考人类决策的接口，并将其与基于计算机视觉的决策进行比较。由于该研究领域中的严格评估方法并未明确定义，并且由于信息转移到视障人士的细节，因此提出了针对特定简化指导指令的评估标准。

translated by 谷歌翻译

Finding Common Ground for Incoherent Horn Expressions

Ana Ozaki , Anum Rehman , Philip Turk , Marija Slavkovik

分类：人工智能

2022-09-14

在与人共享环境中运行的自主系统需要能够遵循他们所占据的社会的规则。尽管法律对于一个社会是独一无二的，但不同的人和机构可能会使用不同的规则来指导其行为。我们研究了可能不一致的行为规则中达到共同基础的问题。我们正式定义了共同基础的概念，并讨论了该概念的主要特性。然后，我们确定了保证存在共同点的喇叭表达式的三个足够条件。我们提供了在这些条件下计算共同基础的多项式时间算法。我们还表明，如果删除了这三个条件中的任何一个，则可能不存在结果（较大）类的共同点。

translated by 谷歌翻译

SOLBP: Second-Order Loopy Belief Propagation for Inference in Uncertain Bayesian Networks

Conrad D. Hougen , Lance M. Kaplan , Magdalena Ivanovska , Federico Cerutti , Kumar Vijay Mishra , Alfred O. Hero III

分类：人工智能 | 机器学习 | (统计)机器学习

2022-08-16

在二阶不确定的贝叶斯网络中，条件概率仅在分布中已知，即概率上的概率。Delta方法已应用于扩展精确的一阶推理方法，以通过从贝叶斯网络得出的总和产物网络传播均值和方差，从而表征了认知不确定性或模型本身的不确定性。另外，已经证明了Polytrees的二阶信仰传播，但没有针对一般的定向无环形结构。在这项工作中，我们将循环信念传播扩展到二阶贝叶斯网络的设置，从而产生二阶循环信念传播（SOLBP）。对于二阶贝叶斯网络，SOLBP生成了与Sum-Propoduct网络生成的网络一致的推论，同时更加有效且可扩展。

translated by 谷歌翻译

3D Lidar Reconstruction with Probabilistic Depth Completion for Robotic Navigation

Yifu Tao , Marija Popović , Yiduo Wang , Sundara Tejaswi Digumarti , Nived Chebrolu , Maurice Fallon

分类：机器人

2022-07-25

机器人技术中的安全运动规划需要已验证的空间规划，这些空间没有障碍。但是，由于其深度测量值的稀疏性，使用LiDARS获得此类环境表示是具有挑战性的。我们提出了一个学习辅助的3D激光雷达重建框架，该框架借助重叠的摄像头图像来为稀疏的激光雷达深度测量，以生成比单独使用原始liDar测量值可以实现更明确的自由空间的较密集的重建。我们使用带有编码器解码器结构的神经网络来预测密集的深度图像以及使用体积映射系统融合的深度不确定性估计。我们在使用手持式传感设备和腿部机器人捕获的现实世界室外数据集上进行实验。我们使用来自16束束激光雷达映射建筑网络的输入数据，我们的实验表明，通过我们的方法，估计的自由空间的量增加了40％以上。我们还表明，我们在合成数据集通用上训练的方法非常适合现实世界户外场景，而无需进行其他微调。最后，我们演示了运动计划任务如何从这些密集的重建中受益。

translated by 谷歌翻译

Using the Polar Transform for Efficient Deep Learning-Based Aorta Segmentation in CTA Images

Marin Benčević , Marija Habijan , Irena Galić , Danilo Babin

分类：计算机视觉

2022-06-21

医疗图像分割通常需要在单个图像上分割多个椭圆对象。这包括除其他任务外，还分割了诸如轴向CTA切片的主动脉之类的容器。在本文中，我们提出了一种一般方法，用于改善这些任务中神经网络的语义分割性能，并验证我们在主动脉分割任务中的方法。我们使用两个神经网络的级联反应，其中一个基于U-NET体系结构执行粗糙的分割，另一个对输入的极性图像转换执行了最终分割。粗糙分割的连接组件分析用于构建极性变换，并且使用磁滞阈值融合了对同一图像的多个转换的预测。我们表明，这种方法可以改善主动脉分割性能，而无需复杂的神经网络体系结构。此外，我们表明我们的方法可以提高稳健性和像素级的回忆，同时根据最新的状态实现细分性能。

translated by 谷歌翻译

Informative Path Planning for Active Learning in Aerial Semantic Mapping

Julius Rückin , Liren Jin , Federico Magistri , Cyrill Stachniss , Marija Popović

分类：机器人

2022-03-03

空中图像的语义分割是映射和地球观察的重要工具。但是，对细分的监督深度学习模型依赖大量的高质量标记数据，这是劳动密集型且耗时的生成。为了解决这个问题，我们提出了一种新方法，用于使用无人机（UAV）自主收集有用的模型培训数据。我们利用一种贝叶斯方法来估计语义分割中的模型不确定性。在任务过程中，语义预测和模型不确定性被用作地形映射的输入。管道的一个关键方面是将映射的模型不确定性与基于主动学习的机器人计划目标联系起来。这使我们能够自适应地指导无人机收集最有用的地形图像，该图像被人类标记用于模型培训。我们对现实世界数据的实验评估表明，与静态覆盖路径相比，在最大化模型性能和减少标签工作方面，使用我们的信息计划方法的好处。

translated by 谷歌翻译